적분(integral)을 가장 쉽게 이해하는 방법은 x축과 함수 곡선 사이의 면적을 구하는 연산이라고 생각하면 된다.
만약 함수를 $f(x)$ 라고 표기 한다면 적분은 다음과 같이 표기하고 "$x=a$부터 $x=b$까지의 적분"이라고 읽는다.
$$ \int_a^b f(x) dx $$이 적분값은 다음 그림에서 색칠된 부분의 면적과 같다.
적분의 수학적 정의는 대략 다음과 같다.
$$ \int_{a}^{b} f(x)dx \approx \sum_{k=1}^{n}f(x_k) \Delta x $$여기에서 $\Delta x$는 $[a, b]$ 구간을 $n$개로 나눈 길이이고 $$ \Delta x =\frac {b-a} {n} $$
$f(x_k)$는 $\Delta x$ 구간 사이의 임의의 값이다. 위 그림에서는 구간에서의 $f(x)$의 왼쪽값, 즉 직사각형이 시작하는 위치로 하였다.
이 정의에서 $n$ 을 무한대로 증가시켰을 때 수렴하는 값이 바로 적분의 수학적 정의이다. $n$ 이 증가하면 면적을 이루는 직사각형의 숫자는 증가하지만 직사각형의 폭 $\Delta x$ 는 0으로 작아진다.
확률 모형과 관련된 이론에서는 다음과 같은 적분식들이 자주 나온다. 이식에서 사용된 함수 $p(x)$ 는 확률 밀도 함수(probability density function)이다.
$$ \int_{-\infty}^{\infty} p(x) dx $$$$ \int_{-\infty}^{\infty} x p(x) dx $$이 적분식들의 의미를 살펴보자. 우선 위의 식을 적분의 정의에 따라 $n$ 개의 직사각형 구간으로 나누면 다음과 같다.
$$ \int_{-\infty}^{\infty} p(x) dx \approx \sum_{k=1}^{\infty} p(x_k) \Delta x $$확률 밀도 함수에서 구간의 면적 $p(x_k) \Delta x$ 는 해당 구간 즉 사건(event)에 대한 확률이다. 따라서 다음과 같이 쓸 수 있다.
$$ \int_{-\infty}^{\infty} p(x) dx \approx \sum_{k=1}^{\infty} p(x_k) \Delta x \approx \sum_{k=1}^{\infty} P(\{x_k, x_k+\Delta x\}) \approx \sum_{k=1}^{\infty} P_k $$이 값은 확률의 정의에 따라 1이 된다.
$$ \int_{-\infty}^{\infty} p(x) dx = 1 $$두번째 적분식은 마찬가지로 다음과 같이 볼 수 있다.
$$ \int_{-\infty}^{\infty} x p(x) dx \approx \sum_{k=1}^{\infty} ( P_k \cdot x_k ) $$이 식에서 $( P_k \cdot x_k )$ 은 $k$번째 구간의 대표값 $x_k$ 에 그 구간의 확률 $P_k$ 를 곱한 것이다.
확률 $P_k$ 를 일종의 가중치(weight)로 생각하면 이 값은 각 대표값에 대한 가중 평균(weighted average)로 볼 수 있다.
따라서 일반적으로 생각하는 기댓값(expectation)의 정의와 일치한다.
주사위의 기댓값을 다음과 같이 구하였던 것을 생각하자
$$ \dfrac{1}{6} \cdot 1 + \dfrac{1}{6} \cdot 2 + \dfrac{1}{6} \cdot 3 + \dfrac{1}{6} \cdot 4 + \dfrac{1}{6} \cdot 5 + \dfrac{1}{6} \cdot 6 = \sum P_k x_k $$